查看原文
其他

本周(4.15-4.21)AI界发生了什么?

赵炜嘉 智能涌现
2024-08-22

文|赵炜嘉

编辑|邓咏仪

封面来源|视觉中国

大佬言论

李彦宏:开源模型将会越来越落后

4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,未来,自然语言将成为新的通用编程语言,每个人都可以成为一名开发者,用自己的创造力改变世界。李彦宏还指出,“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。”

扎克伯格:80亿参数的Llama 3还不够小,大模型需要提升训练质量

4月18日,Llama 3正式发布后,扎克伯格在知名主持人Dwarkesh Patel的播客中,谈及Meta AI的技术路线、未来规划和开源哲学。扎克伯格表示Llama 3最小版本的80亿参数模型“还不够小”,无法满足大量使用场景。他更倾向于将模型蒸馏到5亿、10亿-20亿参数,看看能用来做什么。

李飞飞报告:中国大模型世界第二,但专利数、机器人全球第一

4月15日,由华裔女科学家、“人工智能教母”李飞飞联合领导的HAI研究所(Stanford HAI)近日发布了《2024 年人工智能指数报告》。

报告中指出,2023 年,61 个著名的人工智能模型源自美国的机构,超过欧盟的 21 个和中国的 15 个。然而,中国依然是美国最大的竞争对手,中国的机器人安装量居世界首位;同样,世界上大多数人工智能专利(61%)都来自中国。

△图源:HAI

另外,4月18日,李飞飞在拜登的国情咨文演讲中呼吁,希望拜登政府出资建设一个国家计算能力和数据集仓库。她指出,当前AI学术界明星人才正大量流失,大公司正在以高薪挖掘学术界人才资源。而研究大模型的高昂成本正在将研究人员排除在该领域之外,从而损害了学术界的独立研究。

大事件

Meta 开源新一代模型 Llama 3

当地时间4月18日,Meta 公司宣布最新开源推出新一代大型语言模型Llama 3,包含 8B 和 70B 两种参数规模。Llama 3在由24000块GPU组成的定制集群上,使用15万亿个token训练的,上下文长度实现8K,推理编码大幅提升,代码和权重全开源。Llama 3现可在网页版Meta AI免登录使用。

Stable Diffusion 3 API发布

4月17日,Stability AI正式发布Stable Diffusion 3 API,新的SD3在文字位置、提示词的遵循程度上大幅提升,超过DALL-E 3和Midjourney v6等行业领先模型。目前SD3技术还未完全开源,但Stability AI承诺,对于普通用户,SD3模型不会收费。

前谷歌成员创立的Reka推出新模型,比肩GPT-4、Claude 3

4月16日,由前DeepMind、Google Brain和FAIR成员组成的AI初创公司Reka推出与GPT-4匹敌的多模态大模型Reka Core,具备理解图像、音频和视频的能力,支持32种语言,性能可与GPT-4和Claude 3 Opus匹敌。不过,Reka没有计划开源此模型。

AI界前线

OpenAI在东京开设亚洲首个办事处

4月15日,OpenAI宣布在日本东京设立亚洲首个办事处,承诺与政府、当地企业及研究机构合作,开发安全的AI工具满足本地需求。同时,OpenAI还宣布推出一款专为日本语言优化的GPT-4定制模型,其在翻译和总结日语文本方面表现出色,性能和速度都有显著提升,成本效率更高,速度提升至原来的三倍。

波士顿动力推出电动版Atlas机器人

当地时间4月17日,在宣布原液压版Atlas人形机器人退役的一天后,波士顿动力推出全电动版本的 Atlas机器人。电动Atlas动作的自由度和灵活性远超人类。它继承了液压版的三指设计,采用比其前身更加流线型的设计,有着更灵活的机械骨架,具有类似环形灯的头部,没有任何电缆外露。

△图源:波士顿动力

英特尔推出全球最大神经拟态系统,比人脑快200倍

当地时间4月17日,美国芯片巨头英特尔(Intel)公司宣布,其已经建立了世界上最大的神经拟态系统Hala Point,拥有11.5 亿个神经元和1280亿个突触,速度最高可达人脑的200倍。该系统系统最初部署在桑迪亚国家实验室,采用英特尔Loihi 2处理器,旨在支持未来类脑AI的研究。

文心一言4.0工具版上新,还发了三大AI开发工具

4 月 16 日,在2024百度Create AI开发者大会上,百度正式宣布基础模型全面更新,并推出文心一言4.0工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder和模型定制工具ModelBuilder,以对应不同的开发场景。

贾佳亚团队Mini-Gemini全开源

香港中文大学终身教授贾佳亚团队提出多模态模型Mini-Gemini,提供从2B到34B的模型大小范围,融合ChatGPT+DALL·E 3,具备更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成。目前,Mini-Gemini从代码、模型到数据已全部开源,线上Demo也已发布。

联想发布5款AI PC产品

4月18日,联想TechWorld 2024在上海开幕。联想发布了内嵌个性化AI智能体“联想小天”的AI PC系列产品。用户可基于自然语言与“小天”交互,“小天”在交互中也能不断完善。官方演示中,“小天”具备可实现通过自然语言找到照片、AI跨端生图等本地化AI能力。

融资动态

芯片初创公司 Rivos 融资 2.5 亿美元

4月17日消息,RISC-V芯片初创公司Rivos宣布在 A-3 轮融资中筹集了超过 2.5 亿美元,该笔资金将专项用于研发其首款针对生成式AI()和数据分析工作负载的加速器产品。Matrix Capital为本轮最大投资者管理层,英特尔资本、联发科(MTK)、Cambium Capital、CIDC、Capital TEN以及Hotung Venture Group等投资机构也积极参与了此次融资。

微软将向阿联酋AI公司G42投资15亿美元

4月16日,微软表示将向总部位于阿联酋的人工智能公司G42投资15亿美元,让这家美国科技巨头获得G42的少数股权和董事会席位。G42将在微软的云计算平台Azure上运行,为全球公共部门客户和大型企业提供先进的人工智能解决方案。

新玩意

Rewind宣布更名Limitless,推出可穿戴AI挂坠

4月17日,Rewind更名为Limitless,推出用于会议场景的可穿戴 AI 挂坠,具备提供实时笔记、会议转录和会议摘要等功能,预计将在8月发售,售价99美元。Limitless为用户配备“同意模式”,以确保隐私保护和加密云服务确保数据私密性,用户可控制数据解密。

前沿研究

Meta实现无限上下文长度的新算法

Meta联合南加州大学、CMU、UCSD的研究人员近期发布了论文,提出一种名为Megalodon的算法。这是一种新型神经网络架构,能够高效处理具有无限上下文长度的文本。Megalodon引入了多项创新组件,显著提高了模型的能力、稳定性,以及训练的性价比,并在多个基准测试中表现出优于Llama2的性能。

微软推出单图生数字人技术VASA-1

4月18日,微软发布VASA-1技术,能通过单张图片和音频生成逼真的数字人视频。VASA-1利用面部动态统一编码和Diffusion Transformer技术,实现精准的唇语同步和自然的表情动作,并支持实时生成。

图源:微软

👇🏻 扫码加入「智涌AI交流群」👇🏻

36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

继续滑动看下一个
智能涌现
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存